Je hebt honderdduizenden gegevens in je database. Big data zou je kunnen zeggen. Maar als je deze data niet goed kunt bevragen, brengt het je nog geen informatie. Alsof je rijk bent maar je niks met je geld kunt doen.
De statistische gegevens op zich zijn al wetenswaardig voor bijvoorbeeld natuurbeleid. Maar voor de gebruikers is het zeker ook interessant om op basis van de waarnemingen te kunnen voorspellen wat je nog aan andere waarnemingen kunt verwachten. Dat kun je doen als je weet dat bepaalde soorten meestal gezamenlijk voorkomen in een gebied.
Simpel gezegd: waar je eekhoorns aantreft vind je ook (noten-)bomen maar waarschijnlijk ook hun natuurlijke vijanden marters, roofvogels en katten.
Om hier achter te komen moet je relaties leggen tussen de data (pre-processen van de gegevens) en zoeken naar samenlevingspatronen op grond van dezelfde plaats en tijd. Daarvoor bestaan Business Intelligence tools die Maxime Tijdink in dit proof of concept succesvol heeft ingezet.
Business Intelligence (BI)
“het verzamelen van gegevens binnen de eigen handelingsactiviteit:
een proces van gegevens omzetten in informatie,
die vervolgens leidt tot kennis en aanzetten tot adequate actie.”
Bovenstaande is in bepaalde mate van toepassing op de data van Waarneming.nl. Op deze site voeren meer dan 70.000 geregistreerde gebruikers hun waarnemingen over planten en dieren in het veld in. Al jaren lang. Dat levert een immense hoeveelheid ruimtelijke gegevens op en een schat aan informatie als je verbanden tussen de gegevens kunt leggen.
Maxime Tijdink heeft grote interesse in de mogelijkheden van data mining. Hij pakte de handschoen op en ging de data van Waarneming.nl te lijf. In zijn afstudeerstage voor zijn opleiding Bioinformatics aan de Wageningen University omschreef hij deze uitdaging als volgt:
Data Mining
“het zoeken naar statistische verbanden en het graven naar iets waardevols”
Tijdens zijn internship bij Nieuwland Geo-informatie werkte Maxime met WebGIS Publisher. In een Proof of Concept maakte hij een kaart met alle waarnemingen in een bepaald gebied in een bepaalde periode. De waarnemingen worden in een apart venster statistisch weergegeven, opgedeeld in verschillende taxonomische niveaus van groepen, familie en soorten. Maxime bedacht verschillende presentatievormen; een kolomgrafiek, een lijndiagram en een zoomable zonnestraal plot. De kleuren komen overeen met de kleuren van de presentatie op de kaart.
Als je weet waarop je moet letten, kun je sterker focussen. We kennen het allemaal: als we een andere auto willen kopen en we hebben een bepaald merk en type in gedachten, dan zien we die auto vaker rijden. Zo kun je op zoek gaan naar de Erithacus rubecula omdat je weet dat de Parus major al is waargenomen.
En die ga je vermoedelijk dan ook eerder spotten. Mooi toch?
Meer weten over de mogelijkheden van WebGIS Publisher? Lees verder.